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Введение. Статья посвящена решению задачи синтеза 
управления движением центра масс (задача наведения) 
беспилотного летательного аппарата (БЛА) с большой 
дальностью полета на разгонном участке. Условие управ- 
ления: оптимальный расход топлива. Для решения задачи 
используется принцип динамического программирования 
с учетом ограничений на модуль вектора тяги двигателя. 
Реализация терминального наведения требует формирова- 
ния управления как функции состояния объекта в конце 
участка выведения. Достижение этих граничных условий 
определяет дальнейший переход к баллистической фазе 
полета. 

Материалы и методы. Принцип динамического програм- 
мирования Беллмана является наиболее рациональным с 
точки зрения реализуемости эффективных в вычислитель- 
ном отношении бортовых алгоритмов и решения задачи в 
форме синтеза. При естественной ограниченности вели- 
чины тяги и энергетических ресурсов на борту данный 
принцип позволяет получить решения, не содержащие 
функции переключения. Оптимальное управление в этом 
случае является гладкой функцией (без разрыва производ- 
ной) текущих и конечных параметров БЛА. 
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алгоритмический синтеза — терминального 
управления движения. Его отличие в том, что управление 
движением БЛА на разгонном участке траектории 
формируется функцией текущих и конечных параметров 
движения. Таким образом обеспечивается движение по 
энергетически оптимальной траектории в заданную 
область пространства. Результаты решения задачи 
позволяют строить замкнутые алгоритмы терминального 
наведения для разгонного участка траектории БЛА с 
большой дальностью полета. Такие алгоритмы обладают 


хорошей сходимостью и точностью выведения за счет 
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прогнозирования параметров в процессе полета на 
сокращающемся интервале времени. 
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управления на участке выведения беспилотного летатель- 
ного аппарата с баллистической фазой полета / 


Введение. В настоящее время возможности и сфера применения беспилотных летательных аппаратов 
(БЛА) существенно возросли. В первую очередь это связано с увеличением дальностью полета БЛА. В аппара- 
тах с баллистической фазой полета необходимо предусмотреть возможность управления на различных участ- 
ках, в том числе на разгонном участке выведения БЛА в заданную область. Для формирования управления це- 
лесообразно использовать принцип терминального наведения. При этом управление должно формироваться как 
функция конечных параметров движения, а не функция времени. 

Решению этой проблемы посвящены многие публикации, однако описанная выше задача сохраняет ак- 
туальность. В частности, представляет интерес разработка высокоэффективных в вычислительном отношении 
алгоритмических способов терминального наведения. При этом следует учитывать указанные особенности, 
универсальные для различных типов средств выведения. Они обладают свойствами адаптации и в определен- 
ном смысле удовлетворяют требованиям оптимальности. 

С точки зрения задачи наведения особый смысл имеет такое управление, при котором используется 
минимальное количество топлива. Синтез оптимального управления базируется на применении метода дина- 
мического программирования Беллмана |1 |. 

Материалы и методы. Решение задачи синтеза оптимального управления движением БЛА на разгон- 
ном участке активного полета исследовалось во многих работах. Однако полученное в большинстве случаев 
решение оптимального управления сводится к реализации временной или параметрической программы. Будем 
решать задачу поиска оптимального управления на участке выведения БЛА в следующей постановке. Извест- 
ными являются параметры движения БЛА как координаты Ху, У, 0 текущей точки траектории, получаемые за 
счет решения задачи навигации. Параметры конечной точки Х,, 7У,, /„ удовлетворяют граничному состоянию, 
фиксирующему переход к баллистической фазе полета, определяемой гиперповерхностью в фазовом простран- 
стве. Условию 5; (Х., У,, (,) = 0 удовлетворяет целое множество конечных параметров. Требуется синтезировать 
оптимальное управление в задаче наведения БЛА, которая обеспечивает его перевод из начального состояния 
на гиперповерхность конечных условий. 

В качестве критерия оптимальности принимается количество израсходованного на разгонном участке 
топлива: 


т() = [те (1) 


где т(ГР) — секундовый массовый расход топлива. 


В качестве математической модели движения центра масс принимается следующая система дифферен- 
циальных уравнений: 


В =У®, (2) 
ГО =ИФЕ, (+8), 
где А(Г) — радиус-вектор, 2(/) — вектор силы притяжения Земли, (ГР) — модуль вектора управляющего 
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ускорения. 


Модуль вектора управляющего ускорения Й’(Р) является заданной функцией времени и определяется 


характеристиками двигателя БЛА. Неизвестным является единичный вектор управляющего ускорения Е,(1). 


При решении задачи оптимизации он будет определять требуемые свойства управляемого движения БЛА на 
разгонном участке. Нет необходимости в регулировании величины вектора тяги (в известном смысле это вели- 


чина кажущегося ускорения И’(Г)). Более рациональный подход — максимизация этой величины для применя- 


емого на разгонной ступени носителя двигателя. Это позволяет применить полученные решения и для случая 
использования твердотопливных двигателей. Характеристики двигателя БЛА являются достаточно стабильны- 


ми, и при постоянном секундном расходе топлива т(Р) = соп5{ оптимальность управления определяется про- 


должительностью активного участка полета. В этом случае функционал (Т) будет функцией верхнего предела 
интегрирования. Таким образом, задача минимизации количества топлива превращается в эквивалентную зада- 
чу минимизации продолжительности полета, а критерием оптимальности будет быстродействие. Задача синтеза 
заключается в нахождении ориентации вектора тяги двигателя БЛА, которая определяется направляющими 


косинусами вектора тяги Р(Р) как функции текущих параметров и конечного состояния. 


Сделаем два допущения. Первое. Поскольку большая часть разгонного участка лежит за пределами 
плотных слоев атмосферы, не будем учитывать как ограничение угловую скорость изменения вектора тяги в 
пространстве (продольной оси БЛА). Второе. Движение БЛА будем считать проходящим в определяемой зара- 
нее плоскости. 

Конечное состояние БЛА для перехода к баллистической фазе полета фиксируется выполнением сле- 
дующего граничного условия [2 |: 


м = (У, >, =, ) |, (>, -х,)-И, (^, -х,) |-- 


2 в Хх, т У, У, (3) 
т. (х +У ) | ——— = 
ц ц 2 2 1/2 2 2 \1/2 
(чу?) (жч+у,) 
Здесь х,‚у,,х,,у, — соответственно координаты начальной точки и точки начала функционирования БЛА на 


заключительном участке траектории. Величина текущего значения граничного условия 9,(1) является мерой 


невыполнения условия (3). Математическая запись этого условия соответствует гиперповерхности, которая 
является гладкой функцией фазовых координат и описывает все семейство возможных траекторий выведения 
БЛА [2]. 

Граничные условия заданы для центрального поля притяжения. Уравнения движения БЛА для этого 
случая будут иметь следующий вид: 


= >, 
и 
х, =--ух +— Рсоз@, 
жах, (9) 
3— Г 
и 
д, =-—2х, +-— Рсоза.. 
3°3 2 
| т 
Здесь п, = Г.М, — постоянная центрального поля притяжения Земли, равная произведению гравитационной 


1/2 


постоянной / на массу Земли М; и=(х +х,)”, х=х, х,=Г ,х,=у,х.=И,; Р — величина вектора тяги; Ха — 


У 
аэродинамическая сила лобового сопротивления; У, — аэродинамическая подъемная сила. 

Поскольку БЛА снабжается двигателем с управляемым вектором тяги, то его ориентацию будут опре- 
делять направляющие косинусы. В этом случае ограничение на управления будет определяться соотношением: 


[20| = [Р@соза (0)] +[Р@созо, 0] | <|Р°0). (5) 


Ограничение на управления (5) является «ограничением по гиперсфере». Из этого следует решение, 
при котором оптимальное управление не является кусочно-постоянным, без переключений. В этом случае оп- 
тимальная по быстродействию траектория выведения в фазовом пространстве не имеет «углов» и разрывов 
производной. Оптимальное по критерию быстродействия управление будет представлять собой нелинейную, 
непрерывную функцию граничных условий (3) [3]. 

Задача синтеза формулируется следующим образом. Объект управления из произвольного текущего 
состояния, принимаемого за начальное и определяемого текущим значением 51„ в момент &, переводится на 
гиперповерхность граничного условия 51, =0 в момент &. При этом учитывается ограничение на величину 
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управляющего ускорения (модуля тяги двигателя). Требуется найти оптимальное управление в форме синтеза, 
которое обеспечивает такой перевод за минимальное время. 


Состояние объекта в конечный момент удовлетворяет граничному условию 9, [^(.)]=0 и определяет 
момент перехода к баллистической фазе полета. 
В соответствии с принципом динамического программирования Р. Беллмана [4] необходимым и доста- 
точным условием оптимальности для сформулированной задачи будет соотношение: 
пул 5/6 и) |= (6) 
иЕЦ 
1 


С учетом математической модели объекта, не системой (4), уравнение динамического програм- 
мирования [4] с учетом критерия оптимальности определяется соотношением 


0 0 0 0 
про [ А р [№ НЕ Г. (7) 


4 Хх. 
о 0 т") дх Ох. р т °] 5х, 


где Р, =Рсозо ‚Р, = Рсоза.,. 


В соответствии с методологией динамического программирования Р. Беллмана, операция минимизации 
может быть проведена на основе применения к соотношению (5) неравенства Шварца [3]. Это позволит суще- 
ственно упростить решение задачи оптимизации. Тогда выражение (7) с учетом неравенства (5) будет опреде- 
ляться соотношением 


0 0 0 . 0 2 
ПИ И ее =-Р°'(® 19Г. + тоГ , (8) 
т 


о м Ох ” дх т Ох, т Ох, 


2 4 


В этом случае уравнение Гамильтона — Якоби будет представлено так: 


0 
ее -Р'’(х 
Ох г Ох ТГ 
1/2 й 9 
а О (9) 
х + =—1. 
т дх, т дх, 


Уравнение (9) решается с учетом заданного граничного условия: 
0 
Га, х,,х,,х,)=0, при 


(х,х,, хх) Е. (10) 
Вычисление частных производных величины 5 по фазовым переменным х,х,,х,,х, дает следующие 
зависимости: 
0 
= (2х, хх, т А В. |. 
Ох у у 
1 
05" 
—— = р а | 
Ох " 
с (0) 
сы 2 2 —_ 2 —_ 2 
о ОА ха, |, 
3 
05" Ь 
о ай. О ОА, С. ‚„+х,жх, ). 
х 
4 
Подставляя соотношения (11) в (9) и выполняя несложные преобразования, получаем зависимость: 
0 
п 
0 
С —х,)-2х.х, хх 
2 
<(2х.х, аа Е, РА, ) + (12) 
1/2 ОТ" 
+(2х И Е о ) р =-1 
1 
с граничными условиями 
0 * 
Г ($, ) =0, при (х,х,,х,, Хх.) ЕЗ. (13) 


Выражение в фигурных скобках в (12), обозначенное через 5“(х.), можно записать в компактной фор- 


ме: 
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ОТ" 
5 (х,) = =-1. (14) 
05, 
Уравнение (14) с граничными условиями (13) можно решить различными способами, например мето- 
дом характеристик [5]. Однако более рационально использовать следующую методику. 


Выражение (11) определяет структуру оптимального управления [6]: 
Р„ (2) =-РЕ“"(х), 


оный — (15) 
И’ (х) — —ИЕ”" (х), 
где Ё(х) — единичный вектор тяги. 
Соотношение (15) в скалярном виде: 
Р*' = Рсоза , 
р” = Рсозо,,, (16) 
т’ 
Ох, 
с0$ 0 = | 7, 
ОТ ОТ 
А + Е 
Ох, Ох, 7) 
от’ 
Ох, 
с0$@, = - т 
ОТ" ОТ 
___ + ЗЕ 
Ох, Ох, 


Уравнение (9) и соотношения (17) могут быть преобразованы к более удобному виду по следующим 
соображениям. Исходя из условий формирования множества возмущенных траекторий, за счет варьирования 
управления можно построить в фазовом пространстве гиперповерхность с равным временем выведения, то есть 
изохронную поверхность. Действительно, для каждой из точек фазовой траектории будем вычислять значение 
критерия оптимальности: ДЕ),.ДЬ),..., К). 

Таким образом, получим совокупность траекторий для каждого Ее [1,4]. В силу непрерывности зави- 
симости х(1) и Лот изменяемого управления, множество траекторий образует поверхность в фазовом простран- 
стве Х. Эта граничная поверхность, образованная множеством векторов х[1,.ДЕ)], является выпуклой и гладкой. 
Для условий перехода к баллистической фазе полета изохронная поверхность имеет точку касания с гиперпо- 
верхностью граничных условий. 

При качественной реализации оптимального управления будет уменьшаться расстояние в фазовом про- 
странстве между гиперповерхностью граничных условий 5, =0 и изохронной поверхностью Т (х, Аи, В = 0. В 
некоторое время у двух поверхностей окажется общая точка (рис. 1). 


Эд (х, Ку, Г) —0 


< 


Г(х. В. 9)=0 


Х; 


А:-1 


Рис. 1. Геометрическая интерпретация гиперповерхностей в фазовом пространстве 
при наведении на разгонном участке траектории 
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В точке 5, и Т’они имеют общую касательную, то есть их градиенты в фазовом пространстве совпада- 
ют. Таким образом: 
— отмечается существование оптимальной траектории хо» (1) и оптимального управления иор, (1); 
— определяется окончание разгонного участка траектории (1 = &,.) и переход к баллистической фазе полета. 

В точке касания изохронная поверхность и гиперповерхность граничных условий имеют общую каса- 
тельную и нормаль. Математически условие существования общей нормали определяется выражением [2]: 


Е . 
Ох. Ох. 


где А — константа, определяемая из анализа выпуклости обеих гиперповерхностей. 
На основании соотношений (11) и (18) преобразуем (17). Получим выражение для направляющих коси- 





нусов вектора тяги в функции текущих и конечных параметров движения: 


2 2 
Ри (-2х,х,х, РА, ) (19) 
—- 3 2 2 
2 2 2 1/2 
"(2х ххх, +2, =жх, } +(2х,х —2х,х, 2х, +х,х.Х,, +х,жх, } | 


2 
(2х ЖЕ Лх 2АХ РАМ, АХ, ) 
ДВ = (20) 


2 2 2 2? 
2 2 2 
"(ак +х, хх, +2х.х, -жх, } +(2х.х аа т, +х,жх, } | 


где А=созо, В =с0$0., . 
Из соотношений (19), (20) легко получить естественный для данного типа БЛА параметр для определе- 
ния ориентации вектора управляющего ускорения (в известном смысле вектора тяги) — угол тангажа: 


2 
0$ 0, _ [2% КАХА, +х,жх, } о) 


( 
3(5) = агс 

2 2 
С0$ 0. я а, 2, =жх, } 





В нашем случае движение БЛА проходит в заданной плоскости и угол рыскания Ф (5) =0. С использо- 


ванием предложенной методики синтеза терминального оптимального управления был разработан алгоритм 
расчета угла тангажа [2] и проведено моделирование полета БЛА на ЭВМ [7]. 

Результаты исследования. Численные исследования проводились с использованием программного 
обеспечения, реализующего предложенный способ. Речь идет об алгоритмическом программном обеспечении 
терминального наведения баллистических летательных аппаратов на основе решения краевых задач баллисти- 
ки. Соответствующая программа для ЭВМ зарегистрирована в 2013 году. 

При моделировании использовалось гипотетическое разгонное средство с характеристиками и началь- 
ными условиями выведения БЛА, приведенными в [8]. 

Начальные условия при моделировании и результаты расчетов начального участка приведены в табл. 1. 


Таблица 1 
Начальные условия выведения БЛА 


х> 
5,6323 —0,0000 322,6757 90,00 0,00 0,000 
5,6323 11,1626 322,6756 90,00 1,98 —0.048 
21.4565 69,4705 922.0727 69.34 12,13 —7,881 
155,6274 259,0827 322,6335 60,00 35,91 0,011 


368,3725 464,9493 322,544 1 50,02 43,59 —2,076 
662,2567 679,2317 322,4053 43,44 42,79 —2,582 
10447345 915,1428 322,2176 38,14 40,11 —2,677 
1429,1498 1131,2610 322,0334 36,01 37,94 —2,501 
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График изменения угла тангажа на разгонном участке полета показан на рис. 2. 


зависимость углов тангажа и атаки от величины кажущейся скорости 


т 
т 
т 
т 
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1 
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Зависимость угла входа ГЧ в атмосферу от вепичины кажущейся скорости 


те ан - 
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Рис. 2. Изменение угла тангажа и угла входа БЛА в атмосферу 


Ниже перечислены более полные результаты моделирования, приведенные в [8]. 

1. Полученное управление является субоптимальным вследствие использования граничных условий в ана- 
литическом виде. Для повышения точности граничных условий в алгоритм навигации необходимо ввести алгоритм 
его коррекции, основанный на привлечении более точных моделей гравитационного поля Земли. Таким образом 
повышается точность выведения. 

2. Влияние случайных возмущений компенсируется адаптивными свойствами терминального наведения, а 
также прогнозированием параметров движения и формирования управления на уменыпающийся каждый раз интер- 
вал времени до момента окончания процесса выведения. 

3. Полученные оценки при моделировании позволили рационально выбрать дискретность алгоритмов нави- 
гации и наведения и тем самым ограничить диапазон требований к бортовым ЭВМ при его реализации. 

4. Не вызывает затруднений реализуемость алгоритмов наведения на основе разработанной методики на со- 
временных бортовых ЭВМ. Требуемое быстродействие составляет (1—1,5)х10° к.о./с. 

Обсуждение и заключения. Таким образом, наиболее предпочтительным представляется принцип динами- 
ческого программирования. Именно его следует использовать при решении задачи синтеза оптимального по расходу 
топлива управления движением центра масс (задача наведения) БЛА с большой дальностью полета на разгонном 
участке. 

Известное замечание по применимости динамического программирования, так называемое «проклятие раз- 
мерности», неуместно в задаче формирования управления как функции конечного состояния [5]. Кроме того, ис- 
пользование граничных условий в аналитическом виде существенно упрощает формирование субоптимального 
управления и позволяет оперативно менять задачи полета. Это существенно расширяет возможность примене- 
ния названного алгоритма для БЛА различного назначения. 
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